import pandas as pd

"""
数据集的编码格式：
其中events、persons、places、works为GBK编码方式
poetries为UTF-8编码方式
"""


class Preprocess:
    def __init__(self):
        self.poetries = pd.read_csv("datasets/poetries.csv")

    def poetries_analysis(self):
        # 统计每个朝代的作品数量
        dynasty_counts = self.poetries["dynasty"].value_counts()
        print("每个朝代的作品数量：")
        print(dynasty_counts)

        # 统计各个作者的作品数量
        author_counts = self.poetries["author"].value_counts()
        print("各个作者的作品数量：")
        print(author_counts)


if __name__ == '__main__':
    preprocess=Preprocess()
    preprocess.poetries_analysis()
